Cos'è frequency serie?

Serie di Frequenza

Una serie di frequenza è una rappresentazione tabellare dei dati che mostra la frequenza (cioè il numero di volte) con cui ogni valore o intervallo di valori si verifica in un dataset. È uno strumento fondamentale nella statistica descrittiva per riassumere e visualizzare la distribuzione dei dati.

Ecco alcuni aspetti importanti:

  • Definizione: Una serie di frequenza associa ogni valore o intervallo di valori di una variabile con la sua frequenza corrispondente. (https://it.wikiwhat.page/kavramlar/Frequenza)

  • Tipi di Serie di Frequenza:

    • Serie di frequenza semplice: Elenca ogni valore distinto della variabile e la sua frequenza. È adatta per dati discreti o quando il numero di valori distinti è relativamente piccolo.
    • Serie di frequenza raggruppata (o per classi): I dati vengono raggruppati in intervalli di classe (o classi). Ogni classe ha un limite inferiore e un limite superiore, e la frequenza indica il numero di osservazioni che rientrano in quell'intervallo. (https://it.wikiwhat.page/kavramlar/Intervallo%20di%20Classe)
  • Termini importanti:

    • Frequenza assoluta: Il numero di volte che un valore o una classe si verifica.
    • Frequenza relativa: La proporzione della frequenza assoluta rispetto al numero totale di osservazioni. (Frequenza assoluta / Numero totale di osservazioni). (https://it.wikiwhat.page/kavramlar/Frequenza%20Relativa)
    • Frequenza percentuale: La frequenza relativa espressa come percentuale. (Frequenza relativa * 100).
    • Frequenza cumulativa: La somma delle frequenze di tutte le classi fino a quella corrente. Utile per calcolare percentili e altri quantili. (https://it.wikiwhat.page/kavramlar/Frequenza%20Cumulativa)
  • Costruzione di una Serie di Frequenza Raggruppata:

    • Determinare il numero di classi: Non esiste una regola fissa, ma generalmente tra 5 e 20 classi sono sufficienti. La regola di Sturges (1 + 3.322 * log10(n), dove n è la dimensione del campione) è un'euristica comune.
    • Calcolare l'ampiezza della classe: Approssimativamente (Valore massimo - Valore minimo) / Numero di classi. L'ampiezza della classe dovrebbe essere uniforme, se possibile. (https://it.wikiwhat.page/kavramlar/Ampiezza%20della%20Classe)
    • Definire i limiti di classe: Assicurarsi che le classi siano mutuamente esclusive (un valore non può appartenere a due classi diverse).
    • Contare le frequenze: Contare quante osservazioni rientrano in ogni classe.
  • Vantaggi:

    • Riepiloga grandi dataset.
    • Facilita la visualizzazione della distribuzione dei dati.
    • Semplifica il calcolo di statistiche descrittive.
  • Svantaggi:

    • La serie di frequenza raggruppata comporta una perdita di informazioni, in quanto non si conoscono i valori esatti all'interno di ogni classe.
    • La scelta del numero di classi e dell'ampiezza della classe può influenzare la forma della distribuzione risultante.

Le serie di frequenza sono spesso utilizzate come base per la creazione di istogrammi e poligoni di frequenza, che sono rappresentazioni grafiche della distribuzione dei dati. (https://it.wikiwhat.page/kavramlar/Istogramma) e (https://it.wikiwhat.page/kavramlar/Poligono%20di%20Frequenza)